// 首先为employee.json创建DataFrame，并写出Scala语句完成下列操作：
// 创建DataFrame
import org.apache.spark.sql.SparkSession
val spark=SparkSession.builder().getOrCreate()
import spark.implicits._
val df = spark.read.json("file:///usr/local/spark/employee.json")
// (1) 查询DataFrame的所有数据
df.show()
// (2) 查询所有数据，并去除重复的数据
df.distinct().show()
// (3) 查询所有数据，打印时去除id字段
df.drop("id").show()
// (4) 筛选age>20的记录
df.filter(df("age") > 30 ).show()
// (5) 将数据按name分组
df.groupBy("name").count().show()
// (6) 将数据按name升序排列
df.sort(df("name").asc).show()
// (7) 取出前3行数据
df.take(3) 或df.head(3)
// (8) 查询所有记录的name列，并为其取别名为username
df.select(df("name").as("username")).show()
// (9) 查询年龄age的平均值
df.agg("age"->"avg")
// (10) 查询年龄age的最小值
df.agg("age"->"min")